# !python3      # 使用工具:PyCharm
# 用户登录名:yyds_l
# 项目名称: python爬虫     文件名称:005_python爬虫_urllib_get请求的quote方法
# 创建日期:2022/3/23      创建时间:15:20
# 2022/03/23 15:20

"""ok"""

# https://www.baidu.com/s?wd=%E5%91%A8%E6%9D%B0%E4%BC%A6
# 需求 获取 https://www.baidu.com/s?wd=周杰伦的网页源码

import urllib.request       # 网页请求
import urllib.parse         # 字符编码


url = 'https://www.baidu.com/s?wd='
# 请求对象的定制为了解决反爬的第一种手段
headers = {     # 网络请求头
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
                  ' (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36'
}
# 将周杰伦三个字变成unicode编码的格式
# 我们需要依赖于urllib.parse
io = input("试一试，百度一下：")
name = urllib.parse.quote(io)       # 进行unicode编码
url = url + name
print(url)
# 请求对象的定制
request = urllib.request.Request(url=url, headers=headers)

# 模拟浏览器向服务器发送请求
response = urllib.request.urlopen(request)

# 获取响应的内容
content = response.read().decode('utf-8')

# 打印数据
# print(content)


from lxml import etree

data = etree.HTML(content)
op = data.xpath('//p')
for i in op:
    print(i)